¿Qué es Amazon Athena? | LaComparacion

¿Qué es Amazon Athena? | LaComparacion

Las respuestas que las empresas necesitan de sus datos a veces pueden ser esquivas. Vivimos en una era en la que abundan los datos, especialmente con la expansión al almacenamiento en la nube. Pero las herramientas para analizar y procesar estos datos no siempre son fáciles de usar, demasiado accesibles o incluso efectivas. ¿El problema? Los datos deben residir en algún lugar, y la mayoría de las empresas tienen que pensar en cómo se almacenan, quién accederá a ellos, cómo protegerlos y, lo más importante, cómo hacer que el acceso a los datos sea confiable y rápido. Aquí es donde Amazon Athena puede ayudar. Es un servicio de consulta ya que las compañías pueden ejecutar consultas SQL en sus datos como si residieran en un centro de datos local. No tiene servidor, ya que no tiene que administrar la infraestructura en absoluto ni utilizar software de base de datos para administrarla. Y es extremadamente rápido. Su personal puede ejecutar consultas SQL y esperar resultados incluso en grandes conjuntos de datos en segundos. Para usar Amazon Athena, los datos se alojan primero en Amazon S3 (Simple Storage Service), que es un servicio de almacenamiento de objetos que se ejecuta en la nube. Amazon S3 es lo que hace que los datos sean accesibles y seguros de usar, mientras que Amazon Athena es el servicio de consultas que proporciona el poder para obtener los resultados que necesita de los datos. Esto significa que no tiene que preocuparse por diseñar bases de datos. ¿Una forma de pensar en Athena? Es un poco similar a una búsqueda en Google. Usted sabe que los datos existen, pero a menudo es difícil encontrar los conjuntos de datos que realmente necesita. Una consulta es similar a una búsqueda de Google en el sentido de que crea los parámetros de la consulta SQL que necesita realizar. La diferencia aquí es que está utilizando servicios en la nube en lugar de un motor de búsqueda. Esto no es algo que requiera instalación o configuración, que suele ser el caso con un almacén de datos local y puede involucrar un ETL (Extraer, Transformar, Cargar) que prepara los datos para un base de datos para una consulta aislando el conjunto de datos. En cambio, su consulta puede ejecutarse sin usar ETL y, por lo tanto, simplifica el proceso: ejecuta la consulta desde una consola web fácil de usar. Señala sus datos en S3, configura el esquema e inicia la consulta. Un ejemplo de cómo podría funcionar esto es un negocio minorista que vende una gran cantidad de productos con miles, si no millones, de SKU (unidades de almacenamiento). Una empresa puede querer saber si hay SKU que se eliminarán. Normalmente, esto puede requerir la preparación de un ETL complejo para configurar y preparar los datos para consultas SQL. Debido a la forma en que funciona el almacenamiento de objetos en Amazon S3 y a la integración sin otros servicios web de Amazon (como AWS Glue Data Catalog), las consultas funcionan sin ninguna preparación . Esto significa que las empresas pueden ejecutar una consulta transaccional en el punto de venta como la relacionada con SKU retiradas o realizar otras consultas más rápido y con mejores resultados.

Beneficios de Amazon Athena

Al igual que con la mayoría de los servicios web de Amazon, el principal beneficio de usar Amazon Athena es que ofrece una gran flexibilidad en la forma de ejecutar consultas sin la complejidad adicional. . Un ejemplo de esto es con una compañía farmacéutica que usa la nube para la investigación genómica. Su personal puede decidir ejecutar múltiples consultas contra el conjunto de datos, pero normalmente cada una requiere instalación y configuración para crear una base de datos en la nube que pueda aceptar consultas. Con Athena, el personal puede ejecutar múltiples consultas simultáneas al mismo tiempo, pero confía en los resultados que estarán limpios y accesibles en segundos. Estos resultados de consultas procesables significarán que las empresas tienen acceso a datos limpios y confiables para tomar mejores decisiones y continuar su investigación. Otro beneficio para Athena relacionado con esto es un menor costo. Las empresas no tienen que administrar la huella requerida para los conjuntos de datos, por lo que si ejecutan múltiples consultas o tienen que tomar decisiones relacionadas con un gran tesoro de datos, no tienen que mejorar primero la infraestructura de TI o configurar su almacenamiento de datos para manejar la mayor cantidad de solicitudes. Athena extiende y retrae las variables de rendimiento de acuerdo con las necesidades de las solicitudes en curso. Como se mencionó anteriormente, Athena es lo suficientemente flexible como para manejar una variedad de tareas relacionadas con las consultas de la base de datos. Ejecuta SQL estándar y admite formatos de datos estándar como CSV, JSON, ORC, Avro y Parquet. Athena usa Presto, un motor de consulta SQL de código abierto, con soporte ANSI SQL, por lo que este no es un servicio de consulta patentado que los usuarios necesitarán aprender desde cero. Athena le permite ejecutar consultas SQL rápidas, pero también admite combinaciones y matrices más complejas. En última instancia, el poder entra en juego con Amazon Athena mientras se ejecuta en Amazon S3, por lo que todos los beneficios de esta plataforma de almacenamiento de objetos para su base de datos se transfieren a Athena en términos de reducción de la complejidad, brindando la seguridad y el rendimiento de los puntos finales necesarios y permitiendo a las empresas ejecutar múltiples consultas sin tener que administrar o configurar la infraestructura. Las empresas pueden centrarse más en consultas y resultados reales, no en la plataforma en sí.